Text copied to clipboard!

Titel

Text copied to clipboard!

Sparkutvecklare

Beskrivning

Text copied to clipboard!
Vi söker en erfaren Sparkutvecklare som brinner för att arbeta med stordata och distribuerade system. Som Sparkutvecklare kommer du att spela en nyckelroll i att designa, utveckla och optimera databehandlingslösningar med hjälp av Apache Spark. Du kommer att arbeta i ett tvärfunktionellt team tillsammans med dataingenjörer, dataanalytiker och mjukvaruutvecklare för att skapa skalbara och effektiva dataplattformar. Dina huvudsakliga arbetsuppgifter kommer att inkludera att bygga och underhålla ETL-pipelines, optimera Spark-jobb för prestanda och kostnadseffektivitet, samt att bidra till arkitekturen för vår dataplattform. Du kommer att arbeta med både batch- och strömmande dataflöden och använda moderna verktyg och teknologier inom big data-ekosystemet. Vi söker dig som har en stark teknisk bakgrund och erfarenhet av att arbeta med stora datamängder. Du bör ha god förståelse för distribuerade system, datamodellering och prestandaoptimering. Du är van att arbeta i agila team och har ett lösningsorienterat förhållningssätt. Vi erbjuder en dynamisk arbetsmiljö där du får möjlighet att arbeta med den senaste tekniken inom big data och molnbaserade lösningar. Du får också möjlighet att påverka tekniska beslut och bidra till utvecklingen av vår datainfrastruktur. Om du är passionerad kring data, teknik och innovation, och vill vara en del av ett framåtblickande team, då är detta rätt roll för dig.

Ansvar

Text copied to clipboard!
  • Utveckla och underhålla databehandlingslösningar med Apache Spark
  • Bygga och optimera ETL-pipelines för batch- och strömmande data
  • Samarbeta med dataingenjörer och analytiker för att förstå datakrav
  • Optimera Spark-jobb för prestanda och kostnadseffektivitet
  • Delta i design och arkitektur av dataplattformar
  • Implementera bästa praxis för kodkvalitet och testning
  • Felsöka och lösa problem i produktionsmiljöer
  • Dokumentera tekniska lösningar och processer
  • Bidra till kontinuerlig förbättring av utvecklingsprocesser
  • Hålla sig uppdaterad med nya teknologier inom big data

Krav

Text copied to clipboard!
  • Minst 3 års erfarenhet av Apache Spark
  • Stark kunskap i Scala, Java eller Python
  • Erfarenhet av att arbeta med stora datamängder
  • Förståelse för distribuerade system och datamodellering
  • Erfarenhet av molnplattformar som AWS, Azure eller GCP
  • Kunskap om verktyg som Hadoop, Kafka, Hive eller Airflow
  • Erfarenhet av CI/CD och versionshantering (Git)
  • Förmåga att arbeta i agila team
  • God kommunikationsförmåga på svenska och engelska
  • Relevant högskoleutbildning inom datavetenskap eller liknande

Potentiella intervjufrågor

Text copied to clipboard!
  • Hur många års erfarenhet har du av att arbeta med Apache Spark?
  • Vilka programmeringsspråk har du använt i Spark-projekt?
  • Har du erfarenhet av att arbeta med molnbaserade dataplattformar?
  • Kan du beskriva ett projekt där du optimerade ett Spark-jobb?
  • Vilka verktyg har du använt för att bygga ETL-pipelines?
  • Hur hanterar du felsökning i distribuerade system?
  • Har du arbetat med både batch- och strömmande dataflöden?
  • Hur säkerställer du kodkvalitet i dina projekt?
  • Vilken roll har du haft i tidigare team?
  • Är du bekväm med att arbeta i en agil utvecklingsmiljö?